課程名稱 |
生醫巨量資料處理與分析 Biomedical Big Data Processing and Analytics |
開課學期 |
106-2 |
授課對象 |
工學院 醫學工程學研究所 |
授課教師 |
蔣以仁 |
課號 |
Biomed7114 |
課程識別碼 |
548 M0390 |
班次 |
|
學分 |
3.0 |
全/半年 |
半年 |
必/選修 |
選修 |
上課時間 |
星期二2,3,4(9:10~12:10) |
上課地點 |
|
備註 |
先修課程:醫學資料庫。教室:基醫505。 總人數上限:30人 外系人數限制:5人 |
Ceiba 課程網頁 |
http://ceiba.ntu.edu.tw/1062Biomed7114_ |
課程簡介影片 |
|
核心能力關聯 |
核心能力與課程規劃關聯圖 |
課程大綱
|
為確保您我的權利,請尊重智慧財產權及不得非法影印
|
課程概述 |
第1部分:資料處理
1. 資料庫和資料關連 ?並行資料庫,並行查詢處理,資料庫內部分析
2. MapReduce,Hadoop,與資料庫的關連, 演算法,擴展 (scaling),語言
3. 鍵值存儲和NoSQL;SQL 和 NoSQL 優缺點分析
第2部分:分析
1. 統計建模:基本概念,實驗設計,常見錯誤
2. 機器學習:指導式學習(規則,數,森林,最近鄰點,回歸), 最佳化(梯度下降和變式), 非指導式學習、深度學習與加強式學習
第3部分:結果呈顯
1. 視覺化、資料視覺化呈現工具,視覺化資料分析 ?引用,隱私,倫理,管理
第4部分:探討
1. 圖型分析:資料結構,DFS 及 BFS 分析,網頁排名,social networks,遞迴查詢,語義網
|
課程目標 |
生醫巨量資料處理與分析將概述資料分析師與資料科學家在面對生醫資料、欲回答的問題與分析工具中經常遇到的問題。本課程分為兩部分,第一部分為建立將巨量資料轉化為可用知識的概念,第二部分為雲端巨量資料分析使用的分析系統介紹與資料清理等技巧。 |
課程要求 |
專案實做
專題報告
作業
|
預期每週課後學習時數 |
|
Office Hours |
|
指定閱讀 |
待補 |
參考書目 |
Tom White, Hadoop: The Definitive Guide, O'Reilly Media, 2009.
Jure Leskovec, Anand Rajaraman, Jeff Ullman, Mining of Massive Datasets.
Jared Dean, Big Data, Data Mining, and Machine Learning: Value Creation for Business Leaders and
Practitioners, Wiley. |
評量方式 (僅供參考) |
|
|